Le langage de requêtes XFIRM pour la recherche d'information dans les documents XML
نویسندگان
چکیده
One of the key advantages of XML is its capacity to combine structured and unstructured (text) data. Many languages, based on database-oriented approaches or on information retrieval-oriented approaches, have been proposed in the literature for querying XML corpus. However, they respectively accentuate document structure querying or text querying, but they do not manage to combine it in an attractive way. Moreover, in most cases, users have to perfectly know the document structure, and the syntax of the query language is relatively complex. In this paper, we propose the XFIRM query language, allowing the user to express simple queries based on keywords or more complex queries using document structure MOTS-CLÉS : recherche d’information, XML, langage de requête, modèle de représentation
منابع مشابه
DocCat: un composant logiciel de catégorisation de documents et de marquage sémantique XML
Résumé : Cet article présente DocCat un composant logiciel de catégorisation de documents. Cet outil permet de générer des balises sémantiques et de les stocker dans une base de données au format XML. DocCat intègre une méthode d’apprentissage supervisée pour classer des documents texte dans des catégories prédéfinies. Les catégories ainsi induites permettent le balisage du document. L’intérêt ...
متن کاملExpansion de requêtes pour la recherche d'information multilingue
1. Recherche d'information multilingue : approche par traduction des contenus La quantité d'information en ligne croît très rapidement, ainsi que le nombre de langues dans lesquelles ces contenus sont disponibles. En revanche, la complexité des requêtes reste limitée (2 à 3 mots en moyenne). Des traitements spécifiques s'avèrent donc nécessaires pour préciser le sens de certaines requêtes, ou a...
متن کاملModèle de recherche d'information structurée basé sur la relaxation de requêtes
RÉSUMÉ. Cet article présente un modèle pour la recherche d’information sur des documents XML basée sur la comparaison d’arbres, en utilisant le principe de relaxation de requêtes. Les requêtes et les documents sont représentés par des arbres étendus. Un arbre étendu est construit à partir de l’arbre original, avec la pondération des liens virtuels entre chaque nœud et ses descendants indirects,...
متن کاملCompression de structure XML pour la recherche d'information structurée
RÉSUMÉ. La recherche d’informations dans les documents structurés nécessite le stockage de la structure des documents indexés dans les index. Si de nombreuses méthodes sont connues et largement utilisées pour compresser les index pour les documents plats, le stockage efficient de la structure est peu étudié. Nous présentons une représentation de structure arborescente adaptée à la recherche d’i...
متن کاملViolence du langage dans l’œuvre dramatique de Samuel Beckett : la quête du néant
L’homme beckettien représente grosso modo sur la scène de théâtre des années cinquante le spectacle de souffrance physique et de désintégration totale du sujet qui est le fait d’un trauma et d’un complexe plus profonds, celui du vide de matières scéniques et du mal fondamental qu’on traiterait d’existentiel. En d’autres termes, le mal est dans ce monde quelque chose d’inné chez l’être humain. C...
متن کامل